На страницу третьего семестра
Гипотетические гены во фрагменте 1-5000 3'----[Q8ZNN6,4501-3803]--[Q8ZNN7, 3677-1305]---[Q9X607,768-319]---------5' Так как на самом деле участок начинается с 4229583 остатка, то расположение генов выглядит так: 3'----[<=Q8ZNN6,4234084-4233386]--[<=Q8ZNN7, 4233260-4230888]---[<=Q9X607,4230351-4229902]---------5' Из всех записей, полученных в результате работы с Бласт, пришлось выбрать только три, так как координаты кодирующих участков в большинстве случаев перекрываются. Результаты, выданные банком EMBL: Q8ZNN7 stcC complement(18492..20993) Q9X607 bcfE 9440..10000 Q8ZNN6 stcB complement(20995..21692) Схема расположения генов, по результатам, выданным банком EMBL: 3'----[<=stcB,21692-20995]--[<=stcC,20993-18492]------5' 5'---[bcfE,9440-10000=>]--------------------------3'Таким образом, можно отметить, что расположение генов stcC и stcB похоже в двух случаях, несмотря на то, что в первом случае расстояние между ними в 126 нуклеотидов, а во втором в 2, такие данные очень близки. длина их совпадает с точностью до 1 нуклеотида. Таким образом, их взаимосвязь очевидна. Таким образом, мембранные белки, кодируемые этими генами, наверное кодируются и в полном геноме. Что касается гена Q9X607 , про него сложно сделать какие-либо выводы. На этот ген существует две записи, в одной из них, он фигурирует для гена bcfE, а в другой, он упоминается как "putative fimbrial subunit A" и также ORF2; гомолог fimA. Судя по тому, что даже его расположение в двух случаях находится на комплементарной и прямой цепях, можно сделать вывод, что связи нет.
- seqret kpn_genome.fasta -sask - для того, чтобы вырезать участок из последовательности. - formatdb -i salty_proteome.fasta -p T -n slt -s -t salty_proteome -e - для создания индексных файлов, причем с указанием того, что последовательность аминокислотная. - blastall -p blastx -i kpn2jun2003.fasta -F F -e 0.001 -d slt -o res blastall -p blastx -i kpn2jun2003.fasta -F F -e 0.001 -d slt -o res - для того, чтобы на выходе получить файл с находками сходных участков исодной последовательности и генома salty. Причем с указанием e-value меньше 0.001